Hbase

介绍

起源
- 21世纪的前三驾马车
  - GFS -------------------> HDFS
  - MapReduce------------> MapReduce
  - Bigtable--------------> Hbase
背景：大数据量的数据要求高性能的读写
- 为什么不采用HDFS？
  - 基于文件的颗粒度，必须对整体文件进行操作，读写磁盘
  - 慢
- 需要设计一款数据库工具，能进行大数据量的实时随机读写的存储
  - MySQL：小数据量，不能解决大数据量的问题
  - Redis：能满足性能要求，不能满足大数据量的内存成本要求，安全性较差
  - HDFS：能解决大数据量，不能满足实时
- 怎么解决大数据量？
  - 需要做分布式
- 怎么解决高性能的读写？
  - 基于内存存储
- 内存的成本高，易丢失，不可能满足所有数据的存储！
  - 现象：越新的数据，被处理概率越大，越老的数据，被处理的概率相对较小
  - 解决：将新的数据存储在内存中，对于老的数据达到一定条件时将内存中的数据写入磁盘[写入HDFS]
    - 冷热数据分离
    - 老的数据在HDFS
    - 新的数据在内存
- 数据存储在磁盘，如何保证数据安全？
  - HDFS：基于硬盘做了备份[数据冗余机制]
  - 操作系统：做磁盘冗余阵列RAID1
  - Hbase直接基于硬盘存储，硬盘损坏会导致数据丢失，要考虑数据副本
    - Hbase底层对于文件的存储直接选用了HDFS来保证数据安全性
- 内存的数据丢失如何解决？
  - 操作日志WAL也就是HLog
    - Write Ahead Log：预写日志
    - 预写日志记录内存中所有数据的操作
- 总结：实现分布式高性能读写
  - 基于分布式内存优先对数据读写
  - 所有老的数据持久化在HDFS
- 如果数据在HDFS，从HDFS读，如何解决性能问题？
  - 如何能在一个文件中快速找到一条数据？
    - 构建有序

功能

是一个基于分布式内存和HDFS实现存储的随机、实时读写的NoSQL数据库
- 实现数据的存储
- 提供数据的读写

应用场景

电商：订单存储（超过半年的历史订单需要另外勾选查询）
- 历史订单的存储管理以及查询
游戏：操作日志
- 对大量操作日志进行实时的统计分析处理
金融：消费记录
- 管理查询所有消费记录
电信：账单通话记录
交通：监控车辆信息

特点及概念

特点

分布式：多台机器来搭建集群实现分布式存储
内存：基于分布式内存，数据优先写入了机器的内存
- 内存中的数据达到一定条件，会将内存的数据写入HDFS成为文件
NoSQL：每个NoSQL都有自己的特点
Hbase基于列存储，KV结构的数据库

概念

概念	MySQL	HBase
数据库	database	namespace
表	table	namespace:table
行	主键：primary key	行键：rowkey
列族	无	column family：对列的分组
列	column：每一行有多列，每一行列是一致的	column：每一行可以有多列，每一行的列可以不一样，任何一列必须属于某一个列簇，cf:colName
多版本	无	VERSIONS，一列的值可以存储多个版本
时间戳	默认无，可以有	默认有

Namespace：命名空间，就是MySQL中数据库的概念，用于区分数据存储
- Hbase默认会自带两个namespace：default，Hbase
Table：表，区分更细的数据的划分
- 任何一张表必须属于某一个namespace
- 除了default namespace下的表为，其他任何的namespace下的表在使用时都需要加namespace来访问，即namespace:tableName，namespace实际是表名的一部分
Rowkey：行键，类似于MySQL中的主键
- 功能：
  - 唯一标识一行的数据
  - 构建索引【整个HBASE只有这一个索引，不能有其他索引】
    - rowkey是HBASE的唯一索引
  - HBASE底层默认按照ASCII码【字典顺序】对Rowkey进行排序，以提高查询效率
    - 牺牲一定写的代价换取基于有序的高性能的查询
    - 决定了分区的规则
- 是HBASE中表非常特殊的一列，每张HBASE表都自带这一列，这一列不属于任何列簇
- 难点：Rowkey的值由开发者自行设定
  - Rowkey的值的设计决定了查询效率
- 问题：只有按照RowKey查询才走索引查询，其他所有查询都直接走全表扫描(如何设计Rowkey让查询效率更高?)
  - 解决：
    - 将查询条件组合作为RowKey => Rowkey的设计(rowkey默认是前缀匹配，如果前缀匹配不上，方法不奏效)
    - 二级索引：基于一级索引之上构建一层索引
      - 利用ES构建二级索引
      - 举例：
        
        例如按照标题实现对新闻数据的实时检索
        
        将除了正文部分的数据列存储在ES中
        
        将所有的新闻数据列存储在Hbase中
        
        HBASE中以新闻id作为rowkey，ES中以新闻id作为docId
        
        根据标题去查询ES得到docId即对应于HBASE中的rowkey，以rowkey去查询HBASE
Column Family：列簇，对列进行分组
- 分组是为了提高性能，减少查询数据时的比较
- 如何分组？
  - 组名自定义，可以任意，一般有标识度即可
  - 将拥有相似IO属性的列放在一组
  - 两组
    - CF1：经常被读写的列放在一组
    - CF2：不经常被读写的列
Column：列，类似于MySQL中的列
- HBASE中每个Rowkey，可以拥有不用的列
- 除了Rowkey，任何一列都必须属于某一个列族
- 引用列cf:colName
VERSIONS：多版本，HBASE中允许一列存储多个版本的值
- 列簇级别
  - 如果配置某个列族的版本个数为2，那么此列族下所有的单元都具有2个版本
- HBASE允许存储历史版本的值，行和列相交是单元格组
- 默认HBASE查询时，默认会返回最新的值(默认版本数为1)
- 如何区分一列的多个版本的值？
  - 默认通过时间戳来进行区分不同版本的值
  - 每个RowKey的每一列自带时间戳，用于区分多版本
TimeStamp：HBASE中每一个Rowkey的每一列默认自带这个值，会随着数据的更新时间而变化
- 用于区分多版本

列存储

与其他数据库进行对比
- MySQL：按行存储，写入读取都是行级操作
  - insert：必须指定一行每一列的值，每一行都有固定的列，如果不指定列，值为null
  - select：先对符合条件的行读取，再对列进行过滤
- Redis：按照K V结构行存储
Hbase：按列存储
- 最小颗粒度：列
- 可以为每一行构建不同的列
- 插入：put
  - put每次只能为某一行插入一列
设计思想？为什么这么设计成列存储呢？
- 优点：直接基于列进行读写，提高查询的性能
- 按行存储
  - 先读取所有符合条件的行，再进行对列的过滤
- 按列存储
  - 直接读取需要的列

HBASE架构

分布式主从架构
- HMaster：主节点，负责管理类操作
- HRegionServer：从节点，有多台，用于构建分布式内存
  - HBASE是一个数据库，将一条数据写入HBASE，如何实现分布式存储？
  - 分的规则：将一张表划分成多个region，不同的region分布在不同的RegionServer中
    - HBASE中分区的规则
      - 写入一条数据根据分区规则，决定写入哪个分区，写入到对应分区所在的regionServer上
    - 类似：将一个文件拆分成多个块，将不同的块存储在不同的DN上
HDFS：是按HBASE底层基于数据磁盘持久化的存储
- 达到一定的条件，HRegionServer内存总存储的数据会Flush到HDFS上存储为文件
Zookeeper
- 辅助选举，实现高可用HA，避免Master单点故障
- 用于存储关键性数据

配置

配置zookeeper时为什么要写三个机器的地址及端口
- 这与zookeeper是否是分布式的无关
- 避免由于在连接其中一台机器时，而恰好该机器宕机了，则自动会尝试连接其他机器
当初配置hadoop上更改了哪些文件
- 三个env文件
- 四个site文件
- 一个slaves
  - 内容是集群中三台机器的地址
  - 本地优先计算
    
    slaves文件里面记录的是集群里所有DataNode的主机名，到底它是怎么作用的呢？slaves文件只作用在NameNode上面，比如我在slaves里面配置了 host1 host2 host3 三台机器，这时候如果突然间新增了一台机器，比如是host4，会发现在NN上host4也自动加入到集群里面了，HDFS的磁盘容量上来了，这下子不是出问题了？假如host4不是集群的机器，是别人的机器，然后配置的时候指向了NN，这时候NN没有做判断岂不是把数据也有可能写到host4上面？这对数据安全性影响很大。所以可以在hdfs-site.xml里面加限制。
    
    dfs.hosts /home/hadoop-2.0.0-cdh4.5.0/etc/hadoop/slaves 这相当于是一份对于DN的白名单，只有在白名单里面的主机才能被NN识别。配置了这个之后，就能排除其他DN了。slaves中的内容可以是主机名也可以是IP地址。
hbase.rootdir：用于指定HBASE的数据文件存储在hdfs的什么位置
- 必须是完整的hdfs路径，包含头部
- 如果HDFS做了HA
  - namenode
```
hdfs://mycluster
```
  - HBASE如何知道谁是Active谁是Namenode？
    - 将hdfs-site.xml和core-site.xml放入HBASE的conf目录下
启动与关闭
- 先启动HDFS和Zookeeper
  - HDFS：等待HDFS退出安全模式再启动Hbase
```
start-dfs.sh
```
  - Zookeeper
```
/export/servers/zookeeper-3.4.6/bin/start-zk-all.sh
```
  - 启动Hbase
```
start-hbase.sh
```
  - 关闭hbase
```
stop-hbase.sh
```

客户端操作

HBASE Shell
- 直接使用hbase shell启动
```
hbase shell
```

DDL操作

查看命令方法：Help 'command'
namespace
- 列举：list_namespace
- 创建：create_namespace
```
create_namespace 'ns1'，{'PROPERTY_NAME'=>'PROPERTY_VALUE'}
```
- 删除：drop_namespace
table
- 列举：list
  - 只能列举用户表，系统表不能被列出
- 创建：create
  - ns：表示namespace
  - t1：表示表的名称
  - f1：表示列簇的名称
  - 语法：创建表的时候至少给定表名和一个列簇
```
create 't1','f1','f2','f3'
create 't1',{NAME=>'f1',VERSIONS=>1,TTL=》2592000,BLOCKCACHE=true}
```
- 删除：drop
  - 直接删除表会报错：Table xxx is enabled.Disable it first.
  - 所有的表的结构删除或者修改之前，要先确认这张表没有对外提供服务，是一个禁用状态
    - 如果删除，要先禁用disable
    - 如果修改，要先禁用，后修改，再启用enable
- 查看：desc
```
desc 'student:stu_info'
```

DML操作

put：用于插入/更新数据
```
put 'ns1:t1','r1','f1:c1','value',[ts1]
```
- 参数含义
  - ns1：表示namespace
  - t1：表示表名
  - r1：表示rowkey
  - f1：列簇的名称
  - c1：表示列的名称
  - value：这一列的值
  - ts1：时间戳
get：用于读取数据(一条rowkey数据)，必须指定rowkey
- 是HBASE中最快的读取数据的方式（使用rowkey索引）
scan：用于扫描数据
- 用法一：全表扫描
```
scan 'student:stu_info'
```
- 用法二：scan+过滤器
  - 工作中最常用的方式，可以根据查询条件返回所有符合条件的数据
  - 范围过滤[左闭右开）
    - RowKey是前缀匹配的
    - STARTROW：从哪一条rowkey开始
    - STOPROW：结束于哪一条rowkey
```
scan 'student:stu_info',{STARTROW=>'20200920_001'}
```
delete：用于删除数据
- 如果不加版本默认删除最新版本
- deleteall：删除所有版本

存储设计

存储概念

分布式存储
- 分布式内存：RegionServer
- 分布式磁盘：HDFS
如何实现的：将HBASE中的表构建成分布式的表
- HBASE中的每张表可以对应多个分区[Region]
  - 默认创建只有一个分区（Region）

与HDFS的区别

概念	HDFS	HBase
分类	目录	NameSpace
存储类型	文件	表
分的机制	分块：Block	分区：Region
存储节点	DataNode	RegionServer
规则	大表：128M一个块	RowKey范围

Region：HBASE中表的分区，一张HBASE表可以有多个region，每个region存储在不同的RegionServer中
- 是HBASE做负载均衡的最小单元
- 类似于HDFS中的文件的块
- 一个Region只会归某一个RegionServer所管理
- 一个RegionServer可以管理多个region
- 如何决定数据会写入一张表的哪一个Region中?分区规则是什么？
  - 分区规则：
    - 整个HBASE中的所有数据都是按照字典顺序【ASCII码的前缀逐位比较】进行排序的，所有数据存储时每个分区都有一个范围
      - startKey
      - endKey
    - 规则：按照rowkey所属的范围来决定写入哪个分区
    - Situation1：默认创建的表只有1个分区Region
      - region0：负无穷~正无穷
    - Situation2：创建表的时候指定分区的划分
      - region0：-oo~100
      - region1：100~200
      - region2：200~300
      - ……
      - region9：900~+oo
- Store：列族，按照列族划分不同的Store，这个表有几个列族，region中就有几个Store【一个Store代表一个列族】
  - 设计目的：将不同的列区分存储，就是列族的划分
  - 一个Region里有多个Store
  - MemStore：内存区域
    - 每个Store都有一个
    - 数据先写入MemStore
  - StoreFile：HFILE，物理存储在HDFS上的文件
    - 每个Store中有0或者多个StoreFile文件
    - 达到一定条件之后，Memstore中的数据会被Flush刷写到HDFS变成StoreFile文件

存储模型

假设执行put 'ns1:t1','r1','f1:c1','value',[ts1]
- 步骤
  - 1️⃣根据表名请求元数据找到对应的所有Region信息
  - 2️⃣根据RowKey决定存储到哪个region中
  - 3️⃣将写入请求提交给这个region所在的regionserver中
  - 4️⃣根据列族进行判断，决定写入哪个Store中(也会写入memstore，当达到一定条件时，memstore中的数据会被刷写到HDFS变成storefile文件)

存储流程

写入

默认情况下，执行写入时会写到两个地方：预写式日志（write-ahead log,也称HLog）和MemStore。Hbase默认方式是把写入动作记录在这两个地方，以保证数据持久化。只有当这两个地方的变化信息都写入并确认后，才认为写动作完成。
MemStore是内存里的写入缓冲区，HBase中数据在永久写入磁盘之前在这里累积。
当Memstore填满后，其中的数据会刷写到硬盘，生成一个HFile，HFile里的内容是按照Rowkey字典排序的，也就是说数据是经过MemStore排序过后才写入HFile的。
HFile是HBase使用的底层存储格式。HFile对应于列族，一个列族可以有多个HFile，但一个HFile不能存储多个列族的数据。在集群的每个节点上，每个列族有一个Memstore。
大型分布式系统中硬件故障很常见，HBase也不例外。如果MemStore还没有刷写，服务器就崩溃了，内存中没有写入硬盘的数据就会丢失。应对办法是在写动作完成之前先写入WAL。HBase集群中每台服务器都维护一个WAL来记录发生的变化。WAL是底层文件系统上的一个文件。直到WAL新记录成功写入后，写动作才被认为成功完成。
如果Hbase服务器宕机，没有从MemStore中刷写到HFile的数据可以通过回放WAL来恢复。不需要手动执行。

Step1：根据表名找到这张表对应的所有Region信息
- 问：怎么能得到表所对应的所有的Region信息？
  - 通过元数据来获取
  - HBase自带两张表
    - hbase：meta：记录hbase中所有用户表的元数据信息
      - 两种RowKey
        
        以表明作为rowkey
        
        以region名作为rowkey
    - hbase：namespace：记录了当前hbase中所有namespace的信息
  - 通过put语句中的表名对meta表进行前缀匹配，就能得到这张表所有的region信息2
- 问：如何能知道Meta表所对应的region位置？
  - meta表所对应的region信息都记录在zookeeper中
- HBASE中所有的客户端都要先连接zookeeper
Step2：根据Rowkey以及表的region起始范围进行比较，得到要写入的region
Step3：将写入请求提交给这个region所在的regionServer
- 问：如何能知道这个region所在的regionserver是哪个？
  - 通过元数据来获取这个region所对应的regionserver的地址
Step4：regionserver将输入写入对应的region，根据列族判断写入哪个Store
Step5：先写WAL(HLog)，然后将数据写入MemStore
- 问题：为什么要先写HLog，而后再写MemStore呢？
- 答：**为了防止数据丢失。**如果先写MemStore，写完成之后服务器就挂了，还没有写HLog，而MemStore是内存区域，挂了内存中的数据就丢失了，那么写入的数据也就丢失了。如果先写WAL(HLog)，也就记录了操作日志，当写完HLog和MemStore之后，即是内存数据丢失，也可以根据HLog中的操作日志，在其他HRegionServer中回放这些操作，保证数据的不丢失。
Step6：写入流程结束，返回客户端
- Flush：当Memstore中的数据达到一定条件，会触发将内存中的数据刷写如HDFS变成Sorefile文件
- Compact：将多个storefile文件进行合并成大文件
  - Hbase没有删除和更新，删除和更新都是插入一条数据
  - 老的数据被标记为更新状态或者是删除状态
  - 这个阶段会真正从物理上删除被标记的数据
- Split：如果一个region存储的数据到达一定阈值，一个region会被等分为两个region
  - 分摊单个region存储数据过多，负载过高
  - 分由regionserver来分，两个region的去向由Master来分配

读取

如果想快速访问数据，通用的原则是数据保持有序且尽可能保存在内存里。HBase实现了这两个目标。HBase读动作必须重新衔接持久化到硬盘上的HFile和内存中MemStore里的数据。HBase在读操作上使用了LRU（最近最少使用算法）缓存技术。这种缓存也叫作BlockCache，和MemStore在一个JVM堆里。BlockCache设计用来保存从HFile里读入内存的频繁访问的数据，避免硬盘读。每个列族都有自己的BlockCache。
掌握BlockCache是优化HBase性能的一个重要部分。BlockCache中的Block是HBase从硬盘完成一次读取的数据单位。HFile物理存放形式是一个Block的序列外加这些Block的索引。这意味着，从HBase中读取一个Block需要先查找一次该Block然后从硬盘读取。Block是建立索引的最小数据单位，也是从硬盘读取的最小数据单位。Block大小默认为64KB，如果主要用于随机查询，细粒度的Block更好。Block变小会导致索引变大，消耗更多内存。如果主要用于顺序扫描，一次读取多个Block，那个大一点的Block较好。
从HBase中读出一行，首先检查MemStore，然后检查BlockCache，最后访问HFile。

step1：根据表名从元数据获取对应的region信息
step2：
- 有rowkey
- 无rowkey
step3：根据列族来读取对应Store的数据
step4：读
- 先读memstore
- 如果读memstore【写缓存】没有，就去读BlockCache【读缓存】
- 最后读StoreFile
  - 第一次读取：如果memsotre没有就迫不得已地去读StoreFile
  - 以后再去读，就会将读到的数据先写入BlockCache(默认开启)，避免二次读浪费时间
  - 缓存释放策略：LRU算法(最近最少被使用)

角色功能

HMaster

主要负责集群管理
- 节点管理：regionserver的状态管理
  - 故障转移
- 元数据管理：用于接收所有DDL操作请求
  - 管理meta表以及namespace表的数据
  - 与zookeeper连接，将一些管理类的元数据存储在zookeeper中
- region管理：负责管理每个region的分配
  - 故障恢复
  - split阶段的分配

HRegionServer

接收客户端所有region的读写请求
管理region存储数据：分割
维护：
- WAL
- MemCache
- BlockCache
- 将内存的数据Flush成为StoreFile文件

Zookeeper

构建HA：辅助选举
存储关键性的管理类元数据

HDFS

持久化的实现

HBASE Java API

注意：所有的HBASE客户端所连接的服务端都是Zookeeper

Conf.set("hbase.zookeeper.quorum")，"node1:2181,node2:2181,node3:2181"

Get操作时一个Result对象就代表一个RowKey数据对象

查询

Hbase的根据起止RowKey查询默认是左闭右开的，如果想要得到左闭右闭的结果，可以在查询止rowkey后加上不是rowkey字段的其他值，比如起止rowkey范围是从00到59，而如果直接设置(00,59)查询，则查询不到59这条数据，而如果按照(00,59~)来查询，则会查询出包含59的数据.

Hbase与MapReduce的集成

应用场景

HBASE：分布式存储
MapReduce、Spark：分布式计算
大数据的本质：一系列大数据的处理软件工具对大量数据进行分析处理
- 存储：HBASE
- 计算：MapReduce

集成原理

MapReduce五大阶段
- Input
  - TableInputFormat
- Map
- Shuffle
- Reduce
- Outptut
  - TableOutputFormat

读HBASE数据

代码示例传送门

写HBASE数据

代码示例传送门

问题：如果将代码打包成jar上传至Linux运行会报错ClassNotFoundError:org/apache/hadoop/hbase/HBaseConfiguration

解决：

将HBASE的jar包放入hadoop的环境变量

[root@node1 datas]# hbase mapredcp

[root@node1 datas]# hbase mapredcp
/export/servers/hbase-2.1.0/lib/shaded-clients/hbase-shaded-mapreduce-2.1.0.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/audience-annotations-0.5.0.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/commons-logging-1.2.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/findbugs-annotations-1.3.9-1.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/htrace-core4-4.2.0-incubating.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/log4j-1.2.17.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/slf4j-api-1.7.25.jar

声明环境变量

[root@node1 datas]# export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/export/servers/hbase-2.1.0/lib/shaded-clients/hbase-shaded-mapreduce-2.1.0.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/audience-annotations-0.5.0.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/commons-logging-1.2.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/findbugs-annotations-1.3.9-1.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/htrace-core4-4.2.0-incubating.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/log4j-1.2.17.jar:/export/servers/hbase-2.1.0/lib/client-facing-thirdparty/slf4j-api-1.7.25.jar

BulkLoad

HBASE导入数据的两种方式

第一种方式：Put
- 按照完整的放肆写入写入规则写入数据到HBASE，数据先进入内存
- 问题：如果一次性写入的数据比较大，会导致HBASE的网络、内存、磁盘IO大量地被占用
第二种方式：BulkLoad
- Step1：将大量的数据转换为HFILE文件
- Step2：将转换好的文件加载到HBASE对应的列族的目录中
- 优点：避免了数据经过内存

BulkLoad实现

实现1：代码实现
- 在HBASE中创建一张空表
```
create 'mrhbase','info'
```
- Step1：编辑MapReduce的程序，用于将一个普通文件转换为HFILE文件
```
yarn jar bulk.jar bigdata.itcast.cn.hbase.bulk.TransHfileMR /user/hbase/input/testfile.txt /user/hbase/output
```
  代码示例传送门
- Step2：将生成的HFILE文件加载到HBASE的表中
```
yarn jar bulk.jar bigdata.itcast.cn.hbase.bulk.BulkLoadToHbase /user/hbase/output
```
  代码示例传送门

实现2：HBASE自带程序

HBASE自带一些MapReduce程序

查看帮助

yarn jar /export/servers/hbase-2.1.0/lib/hbase-mapreduce-2.1.0.jar

ImportTSV：将各种类型的文件通过MapReduce使用bulkload或者Put的方式将数据写入Hbase
```
yarn jar /export/servers/hbase-2.1.0/lib/hbase-mapreduce-2.1.0.jar importtsv
```

方式一：通过put的方式将数据写入这张表

Usage: importtsv -Dimporttsv.columns=a,b,c <tablename> <inputdir>

yarn jar /export/servers/hbase-2.1.0/lib/hbase-mapreduce-2.1.0.jar importtsv -Dimporttsv.columns=HBASE_ROW_KEY,info:name,info:age,info:age  mrhbase /user/hbase/input/testfile.txt

-Dimporttsv.columns：用于指定文件中的每一列与HBASE表的每一列的对应关系

方式二：通过bulk方式来实现

step1：用于将输入文件转换为HFILE文件

yarn jar /export/servers/hbase-2.1.0/lib/hbase-mapreduce-2.1.0.jar importtsv -Dimporttsv.columns=HBASE_ROW_KEY,info:name,info:age,info:age -Dimporttsv.bulk.output=/user/hbase/output mrhbase /user/hbase/input/testfile.txt

-Dimporttsv.bulk.output：用于指定生成的HFILE所在的位置

step2：通过bulkload加载到表中

yarn jar /export/servers/hbase-2.1.0/lib/hbase-mapreduce-2.1.0.jar completebulkload  /user/hbase/output mr hbase -loadTable

默认分隔符为tsv，如果不是tsv，指定：seperator = 文件的分隔符
```
'-Dimporttsv.separator=,'
```

Hive与HBASE集成

Hbase自带count命令用于统计一张表中一共有多少行

SQL on HBASE

在Hive中数学SQL，数据存储在HBASE
本质：底层是通过MapReduce来读写HBASE数据
Hbase有一个专用的SQL on Hbase工具：Phoenix
- 这款工具是直接基于Hbase的底层API来实现的
- 这是操作Hbase最快的一款SQL on Hbase工具

Hive与hbase集成

应用场景：希望使用SQL语句操作HBASE

使用前提：

保证Hive中必须有HBASE的jar包

修改hive-site.xml：Hive通过SQL访问HBASE，Hive就是HBASE的客户端，就需要连接Zookeeper

<property>
	<name>hive.zookeeper.quorum</name>
	<value>node1,node2,node3</value>
</property>
 <property>
	<name>hbase.zookeeper.quorum</name>
	<value>node1,node2,node3</value>
</property>
<property>
    <name>hive.server2.enable.doAs</name>
    <value>false</value>
</property>

修改hive-env.sh

export HBASE_HOME=/export/servers/hbase-2.1.0

试用步骤：

启动Hive

#先启动metastore服务
start-metastore.sh 
#然后启动hiveserver
start-hiveserver2.sh
#然后启动beeline
start-beeline.sh

在Hive中创建关联hbase表

如果Hbase中表不存在：【用的比较少】

创建测试数据文件

vim /export/datas/hive-hbase.txt
1,zhangsan,80
2,lisi,60
3,wangwu,30
4,zhaoliu,70

创建测试表

--创建测试数据库
create database course;
--切换数据库
use course;
--创建原始数据表
create external table if not exists course.score(
id int,
cname string,
score int
) row format delimited fields terminated by ',' stored as textfile ;
--加载数据文件
load data local inpath '/export/datas/hive-hbase.txt' into table score;

创建一张Hive与HBASE的映射表

create table course.hbase_score(
id int,
cname string,
score int
)  
stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'  
with serdeproperties("hbase.columns.mapping" = "cf:name,cf:score") 
tblproperties("hbase.table.name" = "hbase_score");

将测试表的数据写入映射表

 set hive.exec.mode.local.auto=true;
 insert overwrite table course.hbase_score select id,cname,score from course.score;

如果Hbase中表已存在，只能创建外部表【比较常用的方式】
```
  create external table course.stu(
  key string,
  name string,
  age  string,
  phone string
  )  
  stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'  
  with serdeproperties("hbase.columns.mapping" = ":key,basic:name,basic:age,other:phone") 
  tblproperties("hbase.table.name" = "student:stu_info");
```
- 注意事项：
  - Hive关联时
    - 如果Hbase表不存在，默认以hive表的第一列作为Hbase的rowkey
    - 如果表已存在，使用:key来标识rowkey
  - Hive与Hbase的关联表
    - 是不能通过load命令加载数据进去的
    - Hbase中的数据时特殊的存储，内存和Storefile存储，必须经过程序写入
    - load命令是直接将文件放入目录的方式实现的，所以不能用于加载数据到hbase
    - 只能用insert命令

HBASE热点

现象
- 读写数据时，大量的读写请求都集中在某个Region或者某个RegionServer上，导致某个Region的负载较高，影响读写性能
原因
- 分区规则：按照范围分区，所要读写的rowkey在哪个范围就读取哪个分区
- 根本原因：所有(大部分)的rowkey都集中在一个范围
解决(参见HBase Rowkey设计)
- 在创建表的时候要根据rowkey的设计进行合理的规划分区
  - 表建好以后就有多个分区
- rowkey的设计
  - rowkey作为唯一索引：rowkey的值是最常用的查询条件，可以走索引查询
  - rowkey必须构建散列，不能是连续的

预分区与Rowkey设计

预分区

命令行实现：

create 'bs1:t1','f1',SPLITS=>['10','20','30','40']

在Java API中创建分区：表名中包含日期(分割区间起始值)

byte[][] splitKeys = {
	Bytes.toBytes(10),
	Bytes.toBytes(20),
	Bytes.toBytes(30),
	Bytes.toBytes(40),
}
admin.createTable(tablename,splitKeys)

注意：

region的范围也是根据rowkey的前缀匹配

实际工作中先设计rowkey，再做预分区

RowKey设计

Rowkey设计的重要性
- 唯一标识一行
- 作为HBASE中的唯一索引，既不能创建也不能删除：只有基于rowkey的查询才走索引
- 决定了分区：rowkey不能是有序的，会导致热点问题
基本原则：设计rowkey必须结合业务需求设计
唯一原则：类似于MySQL中主键的概念，必须唯一标识一行
- Put：既作为插入语句也作为更新语句
组合原则（前缀匹配查询）：将经常作为查询条件的列组合作为rowkey
- HBASE只有rowkey作为索引，只有根据rowkey作为查询条件才能走索引查询
- 举例：
  - 用时间+订单id组作为rowkey
    - 基于时间
    - 基于时间+订单id
- 不是经常作为查询条件的列不要作为rowkey，会影响rowkey的长度设计，导致性能下降
- Rowkey只是利用字段的组合来设计存储，满足查询的需求，并不影响这些字段的实际独立存储
散列原则（热点性）
- 构建随机散列的前缀，避免产生热点问题
- 方案一：在rowkey之前加上一个随机值做组合rowkey
  - 可行，但是会影响读的效率，因为根本不知道随机值是什么
- 方案二：基于前缀构建编码
  - 例如将时间戳进行编码，构建组合rowkey
    - 在读的时候先对时间戳进行编码构建rowkey再进行查询
    - 查询到以后再进行解码
- 方案三：对以连续值作为rowkey的值进行反转再作为rowkey
  - 在读的时候，先反转构建rowkey再查询
长度原则：在满足业务的情况下rowkey的设计越短越好（不建议超过100位）
- 有比如timestamp_userid_orderid此类的rowkey，由于rowkey是前缀匹配，如果只知道userid或者orderid，那么基于rowkey查询就不可用了

二级索引

HBASE只有自带的一级索引：rowkey
思想：通过走两次索引来实现数据查询，代替全表扫描
实现思路：
- 构建一张索引表
  - 1、先查询索引表，根据订单id，走索引查询，得到这个订单在原表中的rowkey
  - 2、根据得到的rowkey去查询原表，走索引查询，得到这个订单的所有数据
问题：原表和索引表如何进行数据同步？
- 方案一：在客户端构建两张表的Put对象，只要往原表中插入，就往索引表插入一条
  - 客户端请求增多
  - 容易导致数据不一致
    - 可能一条Put失败，一条可成功
- 方案二：在HBASE中构建协处理器【类似于Hive中的UDF】
  - 协处理器：HBASE中没有功能，可以自己开发
  - HBASE提供了两种协处理器的接口
    - Observer：观察者类的协处理器
      - 能实现监听，监听原表，只要原表中多了一条数据，让协处理器自动往索引表中插入一条数据
      - 类似于MySQL中的触发器
    - EndPoint：终端者类的协处理器，一般用于做信息统计，类似于MySQL中的存储过程
  - 方案三：通过第三方框架来实现
    - Phoenix：专门为HBASE设计的一款辅助工具
      - 底层是通过多个封装好的协处理器来实现的
      - 可以通过SQL操作HBASE：直接基于HBASE底层的API直接实现的
      - 辅助构建各种HBASE中的二级索引，并自动维护
    - ES：全文索引引擎
      - ES+HBASE

列族与列的设计

列族
- 个属原则：一般不建议超过3个，会影响性能
- 长度原则：在满足需求的情况下，越短越好（底层存储是冗余的）
列的设计
- 与普通的列名称一致，要能通过列名知道这一列的含义
- 多版本，可以利用多版本来实现数据存储

LSM模型与列族属性

LSM(Log-Structured Merge-tree)设计

让数据写入先进入内存，后台将数据不断地写入磁盘，提供高性能的读写的特性
LOG：WAL
特征：通过顺序写来保证写的性能（在MemStore中按照Rowkey字典顺序排序），内存中的数据不断Flush到文件，导致会有多个文件

Flush

在2.x版本之前：Flush是Region级别的，只要有一个MemStore达到阈值触发flush，该region中所有的Memstore都会Flush

功能：将MemStore中的数据溢写到HDFS中，变成StoreFile文件

参数配置：自动触发

#2.x版本之前的机制
#region的memstore的触发
#判断如果某个region中的某个memstore达到这个阈值，那么触发flush，flush这个region的所有memstore
hbase.hregion.memstore.flush.size=128M
#region的触发级别：如果没有memstore达到128，但是所有memstore的大小加在一起大于等于128*4
#触发整个region的flush
hbase.hregion.memstore.block.multiplier=4
#regionserver的触发级别：所有region所占用的memstore达到阈值，就会触发整个regionserver中memstore的溢写
#从memstore占用最多的Regin开始flush
hbase.regionserver.global.memstore.size=0.4
hbase.regionserver.global.memstore.size.lower.limit = 0.4*0.95 =0.38

#2.x版本以后的机制
#设置了一个flush的最小阈值
#memstore的判断发生了改变：max("hbase.hregion.memstore.flush.size / column_family_number",hbase.hregion.percolumnfamilyflush.size.lower.bound.min)
#如果memstore高于上面这个结果，就会被flush，如果低于这个值，就不flush，如果整个region所有的memstore都低于，全部flush
#水位线 = max（128 / 列族个数,16）,列族一般给3个 ~ 42M
#如果memstore的空间大于42,就flush，如果小于就不flush，如果都小于，全部flush
hbase.hregion.percolumnfamilyflush.size.lower.bound.min=16M
#2.x中多了一种机制：In-Memory-compact,如果开启了【不为none】，会在内存中对需要flush的数据进行合并
#合并后再进行flush，将多个小文件在内存中合并后再flush
hbase.hregion.compacting.memstore.type=None|basic

手动触发：尽量避免HBASE自动触发flush
- HBASE自动触发flush、Compact、Split会导致这个过程占用大量的资源，为了避免影响业务其他的操作，使用定期的手动触发来避免自动触发
- 工作中将以上自动触发的参数调大，在达不到的情况下，定时手动触发
  - hbase shell：flush 'tableName' | 'regionName'

Compact

功能：将StoreFile文件进行合并，变成大文件、清除过期，多余版本数据、提高读写效率
minor Compaction：轻量级的合并，每次将最老的几个storefile文件合并成一个文件
major compaction：重量级的合并，将整个store中的storefile进行合并
合并时，会将标记为更新或者删除的数据进行真正的物理删除
封装脚本定时运行：在linux命令行执行hbase命令
- 一行一个命令，最后加一个exit
```
hbase shell /export/datas/hbasesh.txt
```
参数配置
```
hbase.hregion.majorcompaction=7天
```
- 工作中需要配置手动触发，避免自动触发，以免影响业务
```
hbase.hregion.majorcompaction=0
```
- 定期手动触发
```
major_compact
```

Split

功能：当一个region的数据量过大，导致负载比较大，将一个region分裂为两个region

参数配置

#region阈值
hbase.hregion.max.filesize=10GB
#0.94之前：判断region中是否有一个storefile文件是否达到阈值，如果达到，就分裂
hbase.regionserver.region.split.policy=org.apache.hadoop.hbase.regionserver.ConstantSizeRegionSplitPolicy

#0.94开始
#规则：Math.min(getDesiredMaxFileSize(),initialSize * tableRegionsCount * tableRegionsCount * tableRegionsCount)
#initialSize = 128 X 2
#min(10GB,256 x region个数的3次方)
hbase.regionserver.region.split.policy=org.apache.hadoop.hbase.regionserver.IncreasingToUpperBoundRegionSplitPolicy

#2.x开始
#规则：return tableRegionsCount == 1  ? this.initialSize : getDesiredMaxFileSize();
#判断region个数是否为1，如果为1，就按照256分，如果不为1，就按照10GB来分
hbase.regionserver.region.split.policy=org.apache.hadoop.hbase.regionserver.SteppingSplitPolicy

工作中需要避免hbase自动分裂，需要手动干预分裂：导致集群的负载过高
- 关闭自动分裂
```
DisabledRegionSplitPolicy
```
- 手动split
```
split
```

常用列族属性

NAME：标记列族的名称
TTL：版本存活时间，类似于redis中的expire，设置数据的存活时间
VERSIONS：最大版本数，表示某一列最多允许存储多少版本的值
MIN_VERSIONS：最小版本数，一般与TTL搭配使用，当达到TTL时间以后，不会删除所有多版本，默认保留最新的最小版本数
BLOOMFILTER：布隆过滤器
- NONE：不开启布隆过滤
- ROW：行级布隆过滤
  - 当查询数据扫描storefile文件时，如果开启了row级别布隆过滤，会判断当前的storefile文件中是否有需要查询的rowkey，如果有就读文件，如果没有，就跳过这个文件
- ROWCOL：行列级布隆过滤
  - 当查询数据扫描storefile文件时，如果开启了row级别布隆过滤，会判断当前的storefile文件中是否有需要查询的rowkey以及对应的列族和列，如果有就读文件，如果没有，就跳过这个文件
IN_MEMORY：最高缓存级别，一般不要开启，meta表的缓存就是这个级别
BLOCKCACHE：是否开启列族的缓存，默认都是开启的
- 工作中要将不经常读写的列族关闭缓存
- 缓存中使用LRU算法进行淘汰
BLOCKSIZE：文件块的大小，默认为64KB，不建议调整
- 调小：一个文件的块的个数增加，索引增加，占用的内存更多
- 调大：一个文件的块的个数减少，索引减少，占用内存更少
COMPRESSION：Hbase中写入数据的压缩，就是Hadoop的压缩
- 让Hadoop先支持压缩机制
```
hadoop checknative
```
- 让Hbase支持压缩
  - 关闭Hbase的服务
  - 配置Hbase的压缩本地库： lib/native/Linux-amd64-64
```
cd /export/servers/hbase-2.1.0/
mkdir lib/native
```
  - 将Hadoop的压缩本地库创建一个软链接到Hbase的lib/native目录下
```
ln -s /export/servers/hadoop-2.7.5/lib/native /export/servers/hbase-2.1.0/lib/native/Linux-amd64-64
```
- 启动Hbase服务
```
start-hbase.sh
```
- 创建表
```
create 'testcompress',{NAME=>'cf1',COMPRESSION => 'SNAPPY'}
put 'testcompress','001','cf1:name','laoda'
```

Files

Hbase.md

Latest commit

History

Hbase.md

File metadata and controls

Hbase

介绍

功能

应用场景

特点及概念

特点

概念

列存储

HBASE架构

配置

客户端操作

DDL操作

DML操作

存储设计

存储概念

存储模型

存储流程

写入

读取

角色功能

HMaster

HRegionServer

Zookeeper

HDFS

HBASE Java API

查询

Hbase与MapReduce的集成

应用场景

集成原理

读HBASE数据

写HBASE数据

BulkLoad

HBASE导入数据的两种方式

BulkLoad实现

Hive与HBASE集成

SQL on HBASE

Hive与hbase集成

HBASE热点

预分区与Rowkey设计

预分区

RowKey设计

二级索引

列族与列的设计

LSM模型与列族属性

LSM(Log-Structured Merge-tree)设计

Flush

Compact

Split

常用列族属性